智能论文笔记

Taking a Respite from Representation Learning for Molecular Property Prediction

Jianyuan Deng , Zhibo Yang , Hehe Wang , Iwao Ojima , Dimitris Samaras , Fusheng Wang

分类：人工智能 | 机器学习

2022-09-26

人工智能（AI）已被广泛应用于药物发现中，其主要任务是分子财产预测。尽管分子表示学习中AI技术的繁荣，但尚未仔细检查分子性质预测的一些关键方面。在这项研究中，我们对三个代表性模型，即随机森林，莫尔伯特和格罗弗进行了系统比较，该模型分别利用了三个主要的分子表示，扩展连接的指纹，微笑的字符串和分子图。值得注意的是，莫尔伯特（Molbert）和格罗弗（Grover）以自我监督的方式在大规模的无标记分子库中进行了预定。除了常用的分子基准数据集外，我们还组装了一套与阿片类药物相关的数据集进行下游预测评估。我们首先对标签分布和结构分析进行了数据集分析；我们还检查了阿片类药物相关数据集中的活动悬崖问题。然后，我们培训了4,320个预测模型，并评估了学习表示的有用性。此外，我们通过研究统计测试，评估指标和任务设置的效果来探索模型评估。最后，我们将化学空间的概括分解为施加间和支柱内的概括，并测量了预测性能，以评估两种设置下模型的普遍性。通过采取这种喘息，我们反映了分子财产预测的基本关键方面，希望在该领域带来更好的AI技术的意识。

translated by 谷歌翻译

Hardware-in-the-Loop Simulation for Evaluating Communication Impacts on the Wireless-Network-Controlled Robots

Honghao Lv , Zhibo Pang , Geng Yang

分类：机器人

2022-07-14

越来越多的机器人自动化应用程序已更改为无线通信，网络性能对机器人系统的影响越来越大。这项研究提出了一种将模拟机器人平台连接到真实网络设备的硬件（HIL）模拟方法。该项目旨在为机器人工程师和研究人员提供试验的能力，而无需大量修改原始控制器并获得与实际网络条件相关的更现实的测试结果。我们在两种常见的情况下，用于无线网络控制机器人应用程序：（1）移动机器人的安全多机器人协调，以及（2）基于人动物的操纵器的远程操作。在任何情况下，在各种网络条件下都在各种网络条件下部署和测试了HIL模拟系统。对实验结果进行了分析，并将其与先前的仿真方法进行了比较，表明所提出的HIL模拟方法可以识别对机器人系统的更可靠的通信影响。

translated by 谷歌翻译

Target-absent Human Attention

Zhibo Yang , Sounak Mondal , Seoyoung Ahn , Gregory Zelinsky , Minh Hoai , Dimitris Samaras

分类：计算机视觉 | 人工智能

2022-07-04

人类凝视行为的预测对于构建可以预见用户注意力的人类计算机交互式系统很重要。已经开发了计算机视觉模型，以预测人们在寻找目标对象时进行的固定。但是，何时没有目标呢？同样重要的是要知道人们在找不到目标时如何搜索以及何时停止搜索。在本文中，我们提出了第一个以数据驱动的计算模型来解决搜索终止问题，并预测了搜索未出现在图像中的目标的人进行的搜索固定的扫描路径。我们将视觉搜索建模为模仿学习问题，并代表观众通过使用新颖的状态表示来获取的内部知识，我们称之为foveated特征映射（FFMS）。 FFMS将模拟的散发性视网膜集成到预处理的Convnet中，该转向网络产生网络内功能金字塔，所有这些都具有最小的计算开销。我们的方法将FFMS作为逆增强学习中的状态表示。在实验上，我们在预测可可搜索数据集上的人类目标搜索行为方面提高了最新技术的状态

translated by 谷歌翻译

FAST: Searching for a Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation

Zhe Chen , Wenhai Wang , Enze Xie , ZhiBo Yang , Tong Lu , Ping Luo

分类：计算机视觉

2021-11-03

我们提出了一种准确和有效的场景文本检测框架，最快（即，更快的任意形状的文本检测器）。与最近的先进文本探测器不同，使用手工制作的网络架构和复杂的后处理，导致低推理速度，快速有两个新设计。（1）我们通过设计网络搜索空间和奖励功能来搜索网络架构，仔细定制文本检测，导致比大多数搜索图像分类的网络更强大的功能。（2）我们设计一个简单的表示（仅具有1通道输出），以模拟具有任意形状的文本，以及GPU平行后处理，以有效地组装文本线路的时间开销。受益于这两种设计，快速实现了几个具有挑战性的数据集的准确性和效率之间的出色权衡。例如，FAST-A0在总文本的152 FPS下产生81.4％F测量，在准确性和速度方面优于最快的方法1.5点和70 FPS。凭借RentorT优化，推断速度可以进一步加速到超过600 fps。

translated by 谷歌翻译

Artificial Intelligence in Drug Discovery: Applications and Techniques

Jianyuan Deng , Zhibo Yang , Iwao Ojima , Dimitris Samaras , Fusheng Wang

分类：机器学习 | 人工智能

2021-06-09

人工智能（AI）在过去十年中一直在改变药物发现的实践。各种AI技术已在广泛的应用中使用，例如虚拟筛选和药物设计。在本调查中，我们首先概述了药物发现，并讨论了相关的应用，可以减少到两个主要任务，即分子性质预测和分子产生。然后，我们讨论常见的数据资源，分子表示和基准平台。此外，为了总结AI在药物发现中的进展情况，我们介绍了在调查的论文中包括模型架构和学习范式的相关AI技术。我们预计本调查将作为有兴趣在人工智能和药物发现界面工作的研究人员的指南。我们还提供了GitHub存储库（HTTPS:///github.com/dengjianyuan/survey_survey_au_drug_discovery），其中包含文件和代码，如适用，作为定期更新的学习资源。

translated by 谷歌翻译

Semantic-aware Message Broadcasting for Efficient Unsupervised Domain Adaptation

Xin Li , Cuiling Lan , Guoqiang Wei , Zhibo Chen

分类：计算机视觉 | 人工智能

2022-12-06

Vision transformer has demonstrated great potential in abundant vision tasks. However, it also inevitably suffers from poor generalization capability when the distribution shift occurs in testing (i.e., out-of-distribution data). To mitigate this issue, we propose a novel method, Semantic-aware Message Broadcasting (SAMB), which enables more informative and flexible feature alignment for unsupervised domain adaptation (UDA). Particularly, we study the attention module in the vision transformer and notice that the alignment space using one global class token lacks enough flexibility, where it interacts information with all image tokens in the same manner but ignores the rich semantics of different regions. In this paper, we aim to improve the richness of the alignment features by enabling semantic-aware adaptive message broadcasting. Particularly, we introduce a group of learned group tokens as nodes to aggregate the global information from all image tokens, but encourage different group tokens to adaptively focus on the message broadcasting to different semantic regions. In this way, our message broadcasting encourages the group tokens to learn more informative and diverse information for effective domain alignment. Moreover, we systematically study the effects of adversarial-based feature alignment (ADA) and pseudo-label based self-training (PST) on UDA. We find that one simple two-stage training strategy with the cooperation of ADA and PST can further improve the adaptation capability of the vision transformer. Extensive experiments on DomainNet, OfficeHome, and VisDA-2017 demonstrate the effectiveness of our methods for UDA.

translated by 谷歌翻译

A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail

Zhibo Zhang , Ernesto Damiani , Hussam Al Hamadi , Chan Yeob Yeun , Fatma Taher

分类：人工智能

2022-10-26

In recent years, spammers are now trying to obfuscate their intents by introducing hybrid spam e-mail combining both image and text parts, which is more challenging to detect in comparison to e-mails containing text or image only. The motivation behind this research is to design an effective approach filtering out hybrid spam e-mails to avoid situations where traditional text-based or image-baesd only filters fail to detect hybrid spam e-mails. To the best of our knowledge, a few studies have been conducted with the goal of detecting hybrid spam e-mails. Ordinarily, Optical Character Recognition (OCR) technology is used to eliminate the image parts of spam by transforming images into text. However, the research questions are that although OCR scanning is a very successful technique in processing text-and-image hybrid spam, it is not an effective solution for dealing with huge quantities due to the CPU power required and the execution time it takes to scan e-mail files. And the OCR techniques are not always reliable in the transformation processes. To address such problems, we propose new late multi-modal fusion training frameworks for a text-and-image hybrid spam e-mail filtering system compared to the classical early fusion detection frameworks based on the OCR method. Convolutional Neural Network (CNN) and Continuous Bag of Words were implemented to extract features from image and text parts of hybrid spam respectively, whereas generated features were fed to sigmoid layer and Machine Learning based classifiers including Random Forest (RF), Decision Tree (DT), Naive Bayes (NB) and Support Vector Machine (SVM) to determine the e-mail ham or spam.

translated by 谷歌翻译

MiNL: Micro-images based Neural Representation for Light Fields

Hanxin Zhu , Henan Wang , Zhibo Chen

分类：计算机视觉

2022-09-17

光场的传统表示形式可以分为两种类型：显式表示和隐式表示。与将光字段表示为基于子孔图像（SAI）的阵列或微图像（MIS）的透镜图像的明确表示不同，隐式表示将光场视为神经网络，与离散的显式表示相反，这是固有的连续表示。但是，目前，光场的几乎所有隐式表示都利用SAI来训练MLP，以学习从4D空间角坐标到像素颜色的像素映射，这既不紧凑，也不是较低的复杂性。取而代之的是，在本文中，我们提出了Minl，这是一种新型的MI-Wise隐式神经表示，用于训练MLP + CNN，以学习从2D MI坐标到MI颜色的映射。考虑到微图像的坐标，MINL输出相应的微图像的RGB值。 MINL中编码的光场只是训练一个神经网络以回归微图像，而解码过程是一个简单的前馈操作。与普通像素的隐式表示相比，MINL更加紧凑，更高效，具有更快的解码速度（\ textbf {$ \ times $ 80 $ \ sim $ 180}加速）以及更好的视觉质量（\ textbf {1 $ \ \ \ \ \ \ \ \ \ \ \ \ \ \ SIM $ 4DB} PSNR平均改进）。

translated by 谷歌翻译

Explainable Artificial Intelligence to Detect Image Spam Using Convolutional Neural Network

Zhibo Zhang , Ernesto Damiani , Hussam Al Hamadi , Chan Yeob Yeun , Fatma Taher

分类：计算机视觉

2022-09-07

图像垃圾邮件威胁检测一直是互联网惊人扩展的流行研究领域。这项研究提出了一个可解释的框架，用于使用卷积神经网络（CNN）算法和可解释的人工智能（XAI）算法检测垃圾邮件图像。在这项工作中，我们使用CNN模型分别对图像垃圾邮件进行了分类，而hoc XAI方法包括局部可解释的模型不可思议的解释（Lime）和Shapley添加说明（SHAP），以提供有关黑手盒CNN的决定的解释关于垃圾邮件图像检测的模型。我们在6636图像数据集上训练，然后评估拟议方法的性能，包括垃圾邮件图像和从三个不同的公开电子邮件Corpora收集的垃圾邮件图像和正常图像。实验结果表明，根据不同的性能指标，提出的框架实现了令人满意的检测结果，而独立模型的XAI算法可以为不同模型的决策提供解释，以比较未来的研究。

translated by 谷歌翻译

Person Monitoring by Full Body Tracking in Uniform Crowd Environment

Zhibo Zhang , Omar Alremeithi , Maryam Almheiri , Marwa Albeshr , Xiaoxiong Zhang , Sajid Javed , Naoufel Werghi

分类：计算机视觉

2022-09-02

全身追踪器用于监视和安全目的，例如人跟踪机器人。在中东，统一的人群环境是挑战最新跟踪器的常态。尽管过去文献中记录的跟踪器技术有了很大的改进，但这些跟踪器尚未使用捕获这些环境的数据集进行了培训。在这项工作中，我们在统一的人群环境中开发了一个带有一个特定目标的注释数据集。该数据集是在四种不同的情况下生成的，在四种不同的情况下，目标主要是与人群一起移动，有时会与它们阻塞，而其他时候，相机的目标视图在短时间内被人群阻止。注释后，它用于评估和微调最新的跟踪器。我们的结果表明，与初始预训练的跟踪器相比，基于两个定量评估指标的微调跟踪器在评估数据集上的性能更好。

translated by 谷歌翻译